草庐IT

php - KOI8-R转UTF8

全部标签

python - Python如何检查文件名是否为UTF8?

我有一个PHP脚本可以在目录中创建文件列表,但是,PHP只能看到英文文件名,而完全忽略其他语言的文件名,例如俄语或亚洲语言。经过大量努力,我找到了唯一适合我的解决方案-使用python脚本将文件重命名为UTF8,以便PHP脚本可以在之后处理它们。(PHP处理完文件后,我将文件重命名为英文,不保留UTF8)。我使用了以下python脚本,效果很好:importsysimportosimportglobimportntpathfromrandomimportrandintforinfileinglob.glob(os.path.join('C:\\MyFiles',u'*')):ifos.

windows - 在 Windows 上的 IEx(交互式 Elixir 控制台)中启用 UTF8 字符

如何在Windows上的IEx(交互式Elixir控制台)中启用UTF8字符?无法使以下工作:#StringsareallencodedinUTF-8:"héllò"#=>"héllò" 最佳答案 正如评论中所建议的那样,这非常有效:iex--werl它根本不需要您设置任何代码页,而且您可以随时使用UTF8。我建议更新Elixir核心文档,将这个非常有用的开关--werl指出给其他初次使用的用户。 关于windows-在Windows上的IEx(交互式Elixir控制台)中启用UTF8字

php - 在 php 中使用 pthread 进行后台处理

我正在尝试使用pthread在php中实现多线程发送电子邮件。这里的基本思想是将电子邮件作为后台作业发送,这样用户就不必等待任务完成。我有一项服务,用户PHPMailer发送电子邮件及其工作正常。我正在使用以下代码进行多线程classThreadWorkerServiceextends\Thread{private$_runMethod;private$_vars;private$_autoloderPath;function__construct($vars){$this->_vars=$vars;$reflector=new\ReflectionClass('Composer\Au

windows - 在 perl 脚本中或与 perl 脚本一起使用 utf8

我在德语Windows7下运行最新的perl,我想在我的perl程序中的任何地方使用utf8(用于脚本、文件内容、文件名、邮件文本等)。一切正常,但在尝试处理文件名中包含特殊字符的文件时遇到问题。甚至system调用也无法正常工作。那么(如何)我可以告诉perl使用utf8everywhere?我用encode和decode尝试了一段时间,但很不清楚为什么它能正常工作...我还需要encode('cp850',TEXT)以便在命令提示符窗口中正确显示。例子:当我需要复制一个文件时,只有当我使用File::copy(encode("iso-8859-1",$filename),...)并

C#:将 byte[] 转换为 UTF8 编码的字符串

我正在使用一个名为EXIFextractor的库从图像中提取元数据信息。该库部分使用System.Drawing.Imaging.PropertyItem来完成所有艰苦的工作。根据Microsoft文档,PropertyItem中的某些数据(例如图像详细信息等)是作为存储在byte[]中的ASCII字符串获取的。我的问题是国际字符(å、ä、ö等)被删除并替换为问号。当我调试代码时,很明显byte[]是UTF-8的表示。我想将byte[]解析为UTF8字符串,如何在不丢失任何信息的情况下执行此操作?提前致谢!更新:我被要求提供我的代码片段:第一个片段来self使用的类,即由AsimGoh

c# - Encoding.UTF8.GetString 和 Encoding.UTF8.GetBytes 不是彼此相反的原因是什么?

可能我遗漏了什么,但我不明白为什么Encoding.UTF8.GetString和Encoding.UTF8.GetBytes不能作为彼此的逆变换工作?在下面的示例中,myOriginalBytes和asBytes不相等,甚至它们的长度也不同。谁能解释我错过了什么?byte[]myOriginalBytes=GetRandomByteArray();varasString=Encoding.UTF8.GetString(myOriginalBytes);varasBytes=Encoding.UTF8.GetBytes(asString); 最佳答案

c# - C# .NET 中的 UTF-16 安全子字符串

我想得到一个给定长度的子字符串,比如150。但是,我想确保我不会切断unicode字符之间的字符串。例如看下面的代码:varstr="Hello?world!";varsubstr=str.Substring(0,6);此处substr是无效字符串,因为笑脸字符被切成两半。相反,我想要一个执行以下操作的函数:varstr="Hello?world!";varsubstr=str.UnicodeSafeSubstring(0,6);其中substr包含“Hello?”作为引用,以下是我在Objective-C中使用rangeOfComposedCharacterSequencesForR

c# - StreamReader 无法正确读取扩展字符集 (UTF8)

我遇到了无法读取包含外来字符的文件的问题。有人告诉我,该文件以UTF-8格式编码。这是我的代码的核心:using(FileStreamfileStream=fileInfo.OpenRead()){using(StreamReaderreader=newStreamReader(fileStream,System.Text.Encoding.UTF8)){stringline;while(!string.IsNullOrEmpty(line=reader.ReadLine())){hashSet.Add(line);}}}该文件包含“achôcre”一词,但在调试过程中检查它时,它会将

c# - 如何将字符串转换为UTF8?

我有一个包含一些unicode的字符串,如何将它转换为UTF-8编码? 最佳答案 此代码段使用以UTF-8编码的字符串生成一个字节数组:UTF8Encodingutf8=newUTF8Encoding();stringunicodeString="Quickbrownfox";byte[]encodedBytes=utf8.GetBytes(unicodeString); 关于c#-如何将字符串转换为UTF8?,我们在StackOverflow上找到一个类似的问题:

c# - 如何将 xml 作为 UTF-8 而不是 UTF-16 返回

我正在使用序列化的例程。它可以工作,但是当下载到浏览器时,我看到一个空白页面。我可以查看页面源代码或在文本编辑器中打开下载,我看到了xml,但它是UTF-16,我认为这就是浏览器页面显示空白的原因?如何修改我的序列化程序例程以返回UTF-8而不是UTF-16?返回的XML源:JanuaryFebruaryMarchAprilMayJuneJulyAugustSeptemberOctoberNovemberDecember调用序列化程序的示例:DateTimeFormatInfodateTimeFormatInfo=newDateTimeFormatInfo();varmonths=da